AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
信息过载时代,如何真正「懂」LLM?从MIT分享的50个面试题开始

信息过载时代,如何真正「懂」LLM?从MIT分享的50个面试题开始

信息过载时代,如何真正「懂」LLM?从MIT分享的50个面试题开始

人类从农耕时代到工业时代花了数千年,从工业时代到信息时代又花了两百多年,而 LLM 仅出现不到十年,就已将曾经遥不可及的人工智能能力普及给大众,让全球数亿人能够通过自然语言进行创作、编程和推理。

来自主题: AI技术研报
8188 点击    2025-06-25 10:37
从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南

从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南

从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南

强化学习(RL)已经成为当今 LLM 不可或缺的技术之一。从大模型对齐到推理模型训练再到如今的智能体强化学习(Agentic RL),你几乎能在当今 AI 领域的每个领域看到强化学习的身影。

来自主题: AI技术研报
5894 点击    2025-06-22 16:08
ICML 2025 Oral | NAS老树开新花,NUS提出智能体超网,成本狂降55%

ICML 2025 Oral | NAS老树开新花,NUS提出智能体超网,成本狂降55%

ICML 2025 Oral | NAS老树开新花,NUS提出智能体超网,成本狂降55%

LLM 智能体的时代,单个 Agent 的能力已到瓶颈,组建像 “智能体天团” 一样的多智能体系统已经见证了广泛的成功

来自主题: AI技术研报
6993 点击    2025-06-21 17:05
Granola:ChatGPT、Notion 都入场的 AI 纪要,能真正沉淀工作流吗?

Granola:ChatGPT、Notion 都入场的 AI 纪要,能真正沉淀工作流吗?

Granola:ChatGPT、Notion 都入场的 AI 纪要,能真正沉淀工作流吗?

LLM 和 agent 最关键的能力之一就是基于 context 来准确完成用户的任务,而最真实、鲜活的 context 往往不在 Google doc 等文档中,而是存在人与人的对话中,纪要就承载着这一类高价值信息。

来自主题: AI资讯
6945 点击    2025-06-18 16:15
想知道你的LLM API被过度收费了吗?隐藏的Tokens终于可以被审计了

想知道你的LLM API被过度收费了吗?隐藏的Tokens终于可以被审计了

想知道你的LLM API被过度收费了吗?隐藏的Tokens终于可以被审计了

近年来,大型语言模型(LLM)在处理复杂任务方面取得了显著进展,尤其体现在多步推理、工具调用以及多智能体协作等高级应用中。这些能力的提升,往往依赖于模型内部一系列复杂的「思考」过程或 Agentic System 中的 Agent 间频繁信息交互。

来自主题: AI技术研报
6606 点击    2025-06-18 11:05
北航等机构发布最新综述:大语言模型集成 | ArXiv 2025

北航等机构发布最新综述:大语言模型集成 | ArXiv 2025

北航等机构发布最新综述:大语言模型集成 | ArXiv 2025

LLM Ensemble(大语言模型集成)在近年来快速地获得了广泛关注。它指的是在下游任务推理阶段,综合考虑并利用多个大语言模型(每个模型都旨在处理用户查询),从而发挥它们各自的优势。大语言模型的广泛可得性,以及其开箱即用的特性和各个模型所具备的不同优势,极大地推动了 LLM Ensemble 领域的发展。

来自主题: AI技术研报
7683 点击    2025-06-17 17:03
技术Blog-4 | 新一代InfLLM:可训练的稀疏注意力机制

技术Blog-4 | 新一代InfLLM:可训练的稀疏注意力机制

技术Blog-4 | 新一代InfLLM:可训练的稀疏注意力机制

本文深入剖析 MiniCPM4 采用的稀疏注意力结构 InfLLM v2。作为新一代基于 Transformer 架构的语言模型,MiniCPM4 在处理长序列时展现出令人瞩目的效率提升。传统Transformer的稠密注意力机制在面对长上下文时面临着计算开销迅速上升的趋势,这在实际应用中造成了难以逾越的性能瓶颈。

来自主题: AI技术研报
6244 点击    2025-06-16 15:24
专治不服!Amazon重磅发布!AI的SOP高考来了!顶级Agent能考几分?

专治不服!Amazon重磅发布!AI的SOP高考来了!顶级Agent能考几分?

专治不服!Amazon重磅发布!AI的SOP高考来了!顶级Agent能考几分?

您可能会问,LLM Agent的SOP到底是什么,为什么称它为AI的高考?SOP全称是标准操作程序(Standard Operating Procedures)很多朋友可能很熟悉,但它绝不是简单的步骤清单——它更像是AI能否在工业环境中真正"上岗"的终极考验。

来自主题: AI技术研报
6670 点击    2025-06-13 11:35
大模型强化学习新突破——SPO新范式助力大模型推理能力提升!

大模型强化学习新突破——SPO新范式助力大模型推理能力提升!

大模型强化学习新突破——SPO新范式助力大模型推理能力提升!

当前,强化学习(RL)在提升大语言模型(LLM)推理能力方面展现出巨大潜力。DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。

来自主题: AI技术研报
6485 点击    2025-06-09 11:02